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云 环 境 下 面向 负载 均衡 的 数据 密集 型 工作 流 的 数据 约 简 策略 
HER, $ E, Ak 


(中 南大 学 软件 工程 学 院 , 长沙 410075) 


摘 要 : 如 何 对 数据 密集 型 工作 流 应 用 进行 高 效 合理 地 调度 成 为 云 计算 领域 孚 待 解决 的 关键 问题 之 一 。 针 对 此 问题 ， 

rede ne 然后 提出 了 数据 支持 能 力 概 念 ， 通 过 基于 数据 支持 能 力 的 合并 操作 对 模 
行 约 简 。 最 后 优化 超 图 多 层 训 分 算法 , 提出 数据 约 简 的 数据 密集 型 工作 流 调度 策略 HEFT-P。 研究 结果 表明 , HEFT- 

P 相 比 典型 的 工作 流 调度 策略 HEFT、CPOP、MCP， 能 够 很 好 地 对 数据 密集 型 工作 流 进行 约 简 优化 ， 获 得 较 少 的 调度 

时 间 。 
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Data reduced strategy for load-balanced data-intensive workflow in clouds 


Hu Zhigang, Li Jia, Zheng Meiguang 
(College of Software Engineering, Central South University, Changsha 410075, China) 


Abstract: How to schedule data-intensive workflow efficiently and reasonable has become one of the key issue in cloud 
computing. To address this issue, first, we build a directed hypergraph model for data-intensive workflow. And proposing a 
concept data supportive ability to help the presentation of data-intensive workflow application and provide the merge operation 
details considering the data supportive ability. By optimizing the hypergraph multi-level partitioning algorithm, proposing a data 
reduced scheduling policy HEFT-P for data-intensive workflow. Through simulation, the classical HEFT, CPOP and MCP 
scheduling policies was compared with HEFT-P. The results indicate that HEFT-P could obtain reduced data scheduling and 
reduce the makespan of executing data-intensive workflows. 
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T 0 引言 低 复杂 度 以 获取 更 好 的 知识 抽象 ， 在 大 数据 应 用 中 成 为 了 一 个 
9 非常 有 价值 的 研究 课题 。 本 文 的 工作 目的 是 对 云 环 境 下 数据 密 
数据 密集 型 计算 已 经 发 展 成 为 一 种 充满 前 景 的 新 范式 ， 它 。 ”和 集 型 应 用 进行 工作 流 数据 约 简 及 任务 调度 ， 通 过 减少 数据 的 反 

则 在 通过 分 析 研 究 大 量 数据 来 更 好 地 理解 问题 并 细 化 问题 的 求 。 ” 复 传输 及 任务 间 的 通信 和 量 来 减少 工作 流 的 调度 时 间 。 
解 区 域 由 。 云 计算 的 按 需 访问 ， 在 虚拟 计算 环境 下 运行 大 规模 准确 的 任务 调度 模型 是 对 问题 进行 研究 的 基础 ， 它 有 助 于 


应 用 的 可 伸缩 性 和 可 用 性 ， 为 大 数据 的 数据 存储 、 管 理 与 分 析 ”研究 人 员 对 问题 的 理解 和 分 析 ， 从 而 更 好 地 解决 问题 。 目 前 表 
等 方面 提供 了 重要 支撑 中。 基于 云 计算 的 大 型 网 络 应 用 呈现 出 ” 示 依 赖 关 系 的 任务 调度 模型 表示 主要 有 task priority graph (TPG) 
分 布 、 异 构 的 特点 和 数据 密集 的 趋势 ， 如 科学 工作 流 系 统 ， 这 ”和 directed acyclic graph (DAG)。 在 DAG 图 中 每 个 顶点 代表 应 
类 应 用 被 称 为 数据 密集 型 应 用 (Data-Intensive Applications)P!, 用 中 的 一 个 任务 ， 每 条 边 代 表 任 务 间 的 数据 依赖 。 但 随 着 云 环 
这 类 应 用 的 数据 密集 型 主要 体现 在 其 处 理 的 数据 大 小 通常 达 竟 下 的 数据 密集 型 应 用 的 出 现 ， 任 务 间 的 关系 变 得 更 加 复杂 ， 
至 PB 级 。 为 了 能 够 更 加 准确 地 表示 任务 间 的 真实 关系 ， 本 文采 用 有 向 超 
数据 密集 型 应 用 中 的 任务 往往 要 获取 、 处 理 和 传输 大 量 的 ”图 对 数据 密集 型 工作 流 进行 表示 。 有 向 超 图 的 一 条 超 边 可 以 连 
数据 ， 不 合理 的 数据 选择 和 任务 调度 策略 会 导致 数据 的 传输 量 变 多 个 节点 ， 能够 很 好 地 表示 非 对 称 的 依赖 关系 tt]， 清 晰 地 表 
和 访问 量 过 大 。 不 但 增加 了 用 户 使 用 云 资源 的 费用 ， 还 严重 影 。 述 任 务 间 的 多 对 多 关系 四。 它 除 了 拥有 一 般 图 论 所 具有 的 概念 
响 了 科学 工作 流 的 执行 效率 。 因 此 ， 如 何 对 数据 密集 型 工作 流 之 外 ， 还 具有 超 边 合并 、 分 割 等 一 般 图 所 不 具备 的 能 力 。 超 图 
进行 约 简 优 化 ， 简 化 大 数据 的 表征 ， 实 现 大 数据 按 需 约 简 、 降 ”分割 作 为 图 论 中 的 一 个 典型 组 合 优化 问题 ， 在 超大 规模 集成 电 
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路 设计 站、 并 行 


ju TEES AH 


计算 钙 、 图 像 识别 等 领域 都 有 着 广泛 的 
的 优越 性 ， 国 


He IE 


RERI 


割 方 法 ， 主 要 有 多 


Lin/Fiduccia Mattheyses)[lg 以 及 各 种 局 部 优化 算法 
些 算 法 的 图 分 割 软件 包 也 相继 出 现 ， 如 


Devine 5& AU! tij H 


对 超 图 更 加 高 效 的 分 割 。 一 些 学 者 利用 
实际 问题 ， 孙 雪 冬 等 人 05 提 时 


配 均衡 优化 方法 ， 利 用 超 图 的 性 质 ， 


程 结构 相互 作 | 


的 


BI, KL/FM(Kernighan 
。 而 包含 这 
hMETIS、PaToH 等 ， 

bb 了 并行 的 分 割 软 件 Zoltan toolkit， 实 现 了 
点 来 解决 
F『 有 向 超 图 的 工作 流 资 源 分 
动能 力 需 求 集 与 过 
行 优 化 ,Laura 等 


人 tI 采用 有 向 超 图 对 学 习 活动 和 与 其 相关 联 的 组 件 外 保 
持 关 系 进行 建 模 ， 对 相关 算法 来 进行 调整 并 构建 了 学 习 组 件 的 
大 规模 资源 库 。 

前 ， 数 据 密集 型 应 用 E 


学 等 领域 ， 如 何 对 
个 研究 热点 。 经 


finish time (HEFT) 和 
务 优 先 级 对 任务 进行 
了 较 短 的 调度 时 间 。 但 这 两 种 算法 在 处 型 


已 们 进行 高 效 合理 


度 成 为 去 计算 领域 的 
任务 调度 算法 heterogeneous earliest 
critical path on a processor (CPOP)， 根 据 


流 截 止 期 转化 为 
用 优化 算法 ， 在 时 间 约 束 内 对 成 本 进行 优 


单 的 情况 下 不 能 获得 比较 好 的 结果 。 
DAG 图 中 引入 虚拟 数据 存储 节点 ， 

作 流 的 能 耗 感知 的 j 
型 工作 流 中 任务 进 4 
人 [05 通过 分 析 DAG 民 


E 


周 度 策略 ， 从 能 耗 感知 的 角度 来 对 数据 密 
度 ， 从 而 降低 任务 执行 能 耗 。 苑 
活动 的 并 行 和 同步 


Zx 


当 鹏 等 人 0 通过 在 传统 


完成 特征 ， 将 工作 
层 费 
化 。Ahmad 等 A f*** 


REUS. 提出 混合 遗传 算法 (hybrid genetic algorithm,HGA)， 通 


过 在 初始 种 群 
向 ， 能 够 在 较 短 时间 内 怕 
度 较 高 。Lin 等 人 M7 提出 多 云 环 境 下 带 截止 


FP 引入 


启发 式 策略 HEFT 为 最 优 解 的 寻找 提 
速 收敛 到 最 优 解 


动工 作 流 调度 策略 ， 该 策略 引入 局 音 


的 子 任务 进行 局 部 整体 分 配 ， 达 到 压缩 数据 通信 、 
价 的 目的 ， 然 而 该 策略 忽略 了 云 
时 间 等 因素 。Mon 等 人 9, pay 
赖 关 系 的 任务 聚 类 方 《CMTD )， 以 减少 执行 
工作 流 任务 的 计算 粒度 ， 但 是 该 算法 考虑 


VJ 
但 该 算法 时 间 复 杂 
4 代价 驱 
E Jf 
行 代 
Hp 


基于 任务 依 


情况 ， 不 符合 


略 ， 实 现 减少 计算 节点 间 通 信 量 
体 思 路 与 方法 如 下 : 

a) 根据 数据 密集 型 应 
数据 支持 能 力 的 概念 ， 构 建 考 虑 了 数据 支持 能 力 的 有 向 超 医 
型 ， 更 好 地 表达 任务 间 的 关系 ; 
bo 根据 数 扩 


实 的 云 计 算 环境 。 
£x Er. AR 


ECI RE 


TL A ER JA 


c) 在 此 基 


而 最 小 化 计算 节 
上 提出 任务 1 


提高 科学 


非 异 构 


度 算法 HEFTP， 每 个 但 


PEE 


胡 志 刚 ， 等 : 云 环境 1 


的 总 指令 长 度 与 所 在 计算 节点 的 指令 执行 速度 成 比例 ， 使 工作 
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A 
r1 


流 在 满足 负载 均衡 约束 下 获得 更 短 的 完成 时 间 。 
1 ”数据 密集 型 工作 流 的 有 向 超 图 模型 


1.1 模型 定义 
在 一 个 数 ] 


王 务 的 问题 求解 可 能 不 相 


同 ， 但 满足 已 人 


建 模型 。 


一 个 数据 密集 型 工作 流 的 有 


据 文件 中 。 这 就 必然 导 
且 传 输 到 任务 所 在 的 计 
集 型 工作 流 属性 间 的 对 应 关系 ， 


与 人 


V 是 超 图 的 所 有 市 点 集 


其 中 DD de d) 
DoT2sO. E HER EI 
E-XUY, XJ 
的 工作 流 超 边 集合 ， 


超 边 的 权重 。 


FERREA T — lt sssst ， JIR 


任务 节点 ， 记 pred(t;) J t, 的 前 驱 节 点 集 ， 
4E. 没有 前 驱 的 称 为 入 
称 为 出 口 节点 , 记 做 tw。 在 此 基础 上 ， 本 文 定义 工作 流 超 边 。 

定义 1 工作 流 超 边 了 。Vy,, EY ,| 
AEZ 1,, BMI, GET, feT(y,)， 
T(y,) 为 超 边 y 的 尾 节点 外 
Ee Vt, fjeT ， 若 了 we7， 
与 1 为 可 操作 相 邻 人 

为 了 高 效 地 为 和 有 
现 的 功能 进行 分 析 ， 
能 力 的 标识 ， 定 义 刀 

定义 2 "Hj 
服务 48 获取 输入 数 
支持 能 力 4: ， 并 将 此 标 
数据 支持 能 力 的 编号 ， 
有 种 类 的 数据 支持 


A={a,a,,…,4,} , H 


能 力 类 型 总 数 。 


H 节点 , 记 作 Ly , Da 


M, 


5 素 却 可 能 存储 在 相同 的 数 
同一 个 文件 可 能 被 多 个 任务 请 求 ， 并 
。 本 节 利 用 向 超 图 属性 与 数据 密 
E 务 之 间 的 关系 构 


超 图 模型 万 =(V,E) ， 其 中 
分 为 两 类 节点 集合 , V = DUT， 
AX 
E 务 的 支持 边 集 合 ， 了 为 任务 间 依 赖 
Xm7= 纪 。Y 表 示 节 点 的 权重 ，<c 代表 


E 务 节点 集 


虽 密 集 型 应 月 


succ(t;) Jy t; B^ 


当前 任务 去 指向 它 的 


t, e H(y,) 。 


3 v, 的 头 结 点 集 
T(y,) , t HO») , Rt 
E 务 ， 记 做 Att). 
E 务 选择 合适 的 数据 ， 
获取 数据 知识 抽象 ， 本 文 增 


更 好 地 对 数据 能 够 实 
1 了 数据 支持 


EUN H] py, 通过 NWS 


功能 ， 将 其 结果 记 作 数 ] 


其 对 应 的 输入 文件 。 其 中 ， 
数据 所 能 实现 的 功能 类 型 。 应 用 内 
共同 构成 能 力 类 型 集合 A 
怖 支持 能 力 类 型 集合 所 


AL TUR f 
4 为 数据 集 文人 


数据 支持 超 边 。 


定义 3 HALRA X o Vx,eX, md; 指向 以 
A AURIS f; , Bd ED, t,eT, d;eT(x,), teH(x), 其 
P, Tix)cD, HET. 

dj 可 以 和 有 A 


in 


数据 


的 数据 支持 能 力 进 行 映 身 
的 数据 支持 能 力 集 $; ， 所 有 dj I S; 与 4 共 
EE 阵 (Dataset Supportive Ability Matrix, Df), 


RECIF REZIN 


后 继 


FRS D- (dd, odp}, 
基于 此 ， 本 文 定义 


E 构成 dj 所 


同 构 成 了 mx p 的 
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rpm 为 数据 集 节 点 的 个 数 。t 与 A 也 存在 映射 关系 ， 它 构成 了 
执行 时 的 数据 支持 能 力 需 求 集 R 。 所 有 志 的 Ri 与 A 共同 构成 


pxn 的 任务 需求 能 力矩 阵 (Task Requirement Ability Martix, 7M), 


n 为 任务 的 个 数 。 本 文通 过 和 集成 DW 与 TM ga — ^ mx pxn 的 


China 
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三 维 数据 集 -任务 能 力矩 阵 (Dataset-Task Ability Matrix, D7AM), 
如 图 1 所 示 。 如 , T(4dj,@t)=1,1<j<m,，, 
表示 d; 能 够 提供 给 二 执行 时 所 需 的 支持 能 力 wx o 


1<k<p,1<i<n, 


t ty d t ts ty 
di (00 1 0 0 0 E 
d o:00.0 ats 
€ d) Qa 54 ap a d; jo 0 ooo .ol Tavt)=1 
d n 1 0 0 0 qe 
d |1 1 0 0 0 4, lo 0 000 .0 
d; |0 0 1 0 1 
0 0 1 0 0 
i i : t t2 ts ta ts tn 
Y. d i d 0 0001 .0 
dm 000 0 : S 00001 . 0 T(d;,a5,t;) 21 
数据 支持 能 力矩 阵 DM) e glooo Zol Te-1 
d, 00000 .0 
ti t2 ts ta ts ts 
a 0 1 0 0 . 0 
4» j0 0 0 O 1 0 
t b ty t t ts 
a jo 0 0 0 0 . 1f "vi TIT 
4 jo 0 0 1 0 0 d | 0100 0 
gi io: iod ] a, ds |0 0 O O O . 1 T(ds, ay, t) =1 
a lo 0 0 0 0 1 ds | 9999.9 Two)=1 
- d, lo 0 0 0 0 1 
任务 需求 能 力矩 阵 CTM) 
数据 集 - 任 务 支 持 能 力矩 阵 (OTAM) 
图 1 数据 集 - 任 务 能 力矩 阵 DTAM 


基于 以 上 定义 ， 对 有 向 超 图 模型 的 节点 进行 表述 。 
王 务 节点 =(i,R,1,0) eT ， 其 中 ，i 为 任务 节点 的 编码 ， 
R eA。 了 为 4 执行 时 的 输入 数据 ，0 为 执行 完成 时 的 输出 
数据 。 的 支持 数据 集 记 作 : 5; ; 数据 集 节点 dj - US, A) eD, 
其 中 , j 为 数据 集 节点 的 编码 , SA. Vg eX ,车 4 EHO), 
d,eT(x), Wj(R e 5 |R; €AS,c A), 

以 图 2 为 例 ， 数 据 集 节点 d,. d, 具有 的 支持 能 力 为 : 
$ ={a,oj，9 ={a,@j， 任 务 7 所 需要 的 数据 能 力 分 别 
为 ，R ={a}, R ={a}. HER DTAW 可 得 : 
IT(di,a,t)=1, TIT(d,,a,t)=1, I(d.a,.t)-1, 
I(d,,a,1) -1, Mh, t; 的 支持 数据 集 分 别 为 53 ={di,d,}， 
S$ ={d1,d,} 。 本 文 考虑 了 数据 密集 型 工作 流 中 任务 、 数 据 以 
及 数据 支持 能 力 三 者 的 关系 ， 根 据 D74W 矩 阵 得 到 了 图 2， 考 
虑 了 数据 支持 能 力 的 数据 密集 型 工作 流 的 有 向 超 图 模型 ， 图 中 
圆 形 代表 任务 ， 六 边 形 代 表 输 文件 。 通 过 该 映射 操作 ， 本 文 将 
数据 密集 型 工作 流 的 调度 问题 转化 为 有 向 超 图 的 数据 约 简 及 分 
割 问题 。 通 过 该 映射 操作 ， 本 文 将 数据 密集 型 工作 流 的 调度 问 
题 转化 为 有 向 超 图 的 数据 约 简 及 分 割 问题 
1.2 问题 描述 

根据 上 述 对 于 数据 密集 型 工作 流 的 模型 定义 ， 数 据 密集 型 
工作 流 的 调度 时 间 makespan 由 超 图 模型 中 的 关键 路 径 (critical 
path, CP) 所 决定 ， 即 超 图 中 最 长 的 路 径 所 决定 。makespan 的 计 
算 采用 文献 [4] 中， 如 下 所 示 : 


ps 


makespan = max (tlevel (t) + blevel (t, y (1) 


HP, evel(t)) 为 从 入 口 节点 tow $0 t; de Ines 即 从 入 口 任 
务 到 当前 任务 开始 执行 所 需要 的 时 间 ， 其 中 不 包括 的 权重 。 


blevel(t;) 为 从 万 到 出 口 节点 tr 的 最 长 路 径 ， 它 们 的 计算 公式 
blevel(t,) 三 Wi; 十 max fa + blevel(t; ) 2) 
tlevel (t, ) - mar je +tlevel(t,)} (3) 


其 中 : wAMEA t 的 权重 , 即 任务 的 计算 量 ，6i; 为 任务 六 与 其 
后 继任 务 的 通信 量 。 由 以 上 公式 可 见 ， 关 键 路 径 上 关键 任务 的 
计算 量 没 有 办 法 改变 ， 本 文 将 通过 对 关键 任务 进行 合并 或 者 将 
其 分 配 在 同一 计算 节点 增强 本 地 化 等 操作 来 减少 任务 间 的 通信 
， 从 而 减少 任务 的 调度 时 间 makespan 。 
在 对 数据 密集 型 工作 流 的 超 图 模型 进行 操作 时 ， 将 采用 超 
图 分 割 理论 作为 主要 目标 指导 。 给 定 一 个 有 向 超 图 五 =(V,EE) 
和 一 个 整数 上 ， 将 7 分 割 为 上 个 权重 近似 的 节点 子 集 ， 


pM 


a) p, p; =Ø,.(i,j=1,2,...k) ;b) 


lm 


y "T. 
Partition (p, ps,… Pi} ,其 中 ，Pi 的 权重 为 


Æ gH xk 
Wu 要 满 


足以 下 条 件 : 


W; 、 
Un eT idw, eZ ew, (us). AP: eue 


XE SLT £0 33] 8 FE BREL. LARES TF y; 的 节点 至 少 属于 两 个 不 同 
的 分 区 Pi Pit, PK Y CUI, 本文 尝 试 最 小 化 连通 度 ， 即 被 
切割 的 边 数 ， 


201805.00481 v1 


chinaXiv 


录用 稿 


K 


1 


cuts(H, P) = X (4H, P) -1) (4) 


iz 


0 


Jtr, A (H. P) uit v, Hie A DOC. cuts CH, P) 能 够 准确 


地 反映 出 并 行 计算 


衡 条 件 下 不 同 虚 拟 机 间 通 信和 


2 考虑 支持 全 


量 最 


的 通信 开销 ， 最 小 化 连通 度 对 应 于 负载 均 


小 的 目标 。 


EE 力 的 有 向 超 图 模型 


2 ”数据 约 简 的 超 图 分 割 调度 算法 


本 节 将 通过 基于 支持 能 力 的 数据 约 简 与 超 图 切割 算法 来 对 
结构 优化 ， 减 少 任务 的 总 通信 量 ， 从 而 减少 


有 向 超 图 模型 进行 


任务 的 调度 时 间 。 


并 操作 来 实现 ， 从 


个 NP-hard 问题 


基于 支持 能 力 的 数据 约 简 将 通过 对 任务 的 合 
j 减 少 相 同 数据 的 反复 传输 。 超 图 分 割 是 一 


[: 


， 文 中 将 采用 多 


n 


NET 


， 并 对 分 割 算法 
1 基于 支持 能 力 的 合并 
在 数据 密集 型 工作 流 中 ， 任 务 的 输入 输出 数据 量 往往 非常 


， 可 采用 基于 启 
层 算 法 对 数据 密 
进行 优化 ， 以 


大 ， 但 这 其 中 存在 一 些 相 邻 任务 


发 式 的 方法 来 有 效 解决 这 个 问 
集 型 工作 流 超 图 模型 进行 分 
获得 更 好 的 性 能 。 


， 它 们 拥有 共同 支持 数据 ， 如 


果 将 它们 分 配 到 同一 个 虚拟 机 上 ， 则 可 以 减少 因 等 待 数据 传输 


而 造成 的 时 间 消 耗 。 本 文 将 基于 


F 任务 与 支持 能 力 的 关系 根据 


DTANM 甜 阵 求 得 任务 的 支持 数据 集 , 并 按照 以 下 合并 规则 对 这 些 


任务 进行 数据 约 简 ， 减 少 机 
TE Bd AT ETE], pá 
规则 1 合并 处 理 。 


与 1; 可 进行 合 


LI —tI tI -tO otl 


S = CAN. 


操作 。 


HES 


低 算 法 的 复杂 度 。 
到 YA 人 (0 ， 有 5 OSTAD, WE t 
若 合 并 后 的 任务 为 大 ， 则 


t, 


本 文 将 基于 以 上 合并 处 理 的 


对 任务 进行 合并 操作 ，SMA 描 ; 
算法 1 任务 合并 算法 


(SMA) 


输入 : DTAM, H -(V,E) 


输出 : Ho = (Vai ， E) 


a) begin 


b)for t, €T and REA do// 求 任务 的 支持 数据 集 


持 数 据 的 反复 传输 ， 从 而 减少 


‘0=1.0U1.0-t.0Nt,.l 


, 


规则 ,采用 任务 合并 算法 (SMA) 
述 如 下 : 


c) a, €- R,S; < 人 ERRA, SP WEITE 
d)for d; € D do/ 对 于 每 一 个 数据 集 节 点 
e)if T(di,a,t)=1 then 

f) S «-S; ud, 


g) end if 

h) end for 

1) end for 

jfor t, €T do /判断 相 邻 任务 是 否 需要 进行 合并 
k)if ^(5.!;) then 

Dif $505; +Ø and ww; «W,, (1) then 


m) Combine(t,,t;) 
n) end if 

0) end if 

p) end for 

q) end 


伪 代 码 第 2-9 行 求 工作 流 中 任务 的 支持 数据 集 ， 将 任务 i 


的 支持 数据 集 S! 设 为 空 ， 每 个 任务 所 需 的 RN a, YE 
I(d.a,.) -1 的 数据 集 节 点 ， 并 入 集合 $+ ; 第 10-16 行 判 
务 是 否 需要 合并 ， 若 与 1 为 可 操作 相 令 任务， 支持 数据 
交集 不 为 空 ， 并 且 两 任务 的 权重 之 和 小 于 预定 的 最 大 负载 
根据 规则 1 合并 与; 。 合 并 后 的 节点 权重 为 所 合并 的 节 


满足 
断 任 
集 的 
， 则 
点 权 


重 之 和 。 算 法 的 时 间 复 杂 度 为 O(nxm) , n 为 任务 数目 ，m 为 


数据 文件 的 数 
22 面向 支持 数据 的 多 层 剖 分 算法 
在 采用 SMA 算法 对 任务 合并 后 ， 本 文 将 采用 多 层 剖 


分 算 


多 层 剖 分 算法 一 般 分 为 粗 化 、 分 割 、 细 化 三 个 阶段 ， 在 粗 
段 ， 和 迭代 进行 节点 匹配 与 合并 操作 直至 满足 终止 条 件 ， 并 
多 水 平 的 粗 化 超 图 ， 有 效 地 减少 了 原始 超 图 中 超 边 的 条 数 
点 的 数目 ， 在 分 割 阶段 ， 对 粗 化 阶段 得 到 的 最 小 粗 化 超 图 
初始 划分 ， 在 细 化 阶段 ， 将 最 小 粗 化 超 图 的 初始 训 分 投影 
始 超 图 ， 并 在 每 一 层 的 投影 中 对 超 图 划分 进行 优化 ， 有 效 
决 迁移 原始 超 图 中 节点 组 的 问题 。 本 节 对 多 层 齐 分 算法 的 
阶段 进行 优化 。 
2.2.1 基于 支持 数据 的 超 图 粗 化 
对 节点 进行 合并 处 理 之 后 ， 将 对 有 向 超 图 进行 粗 化 操 
在 粗 化 阶段 ， 原 始 的 有 向 超 图 万 =(V,E) 将 会 由 一 个 个 越 
小 的 有 向 超 图 已 - (V. E;) 来 表示 , 即 |V|<|V |<…<|V 
为 节点 的 数目 。 AP, H, 中 的 节点 通过 不 同 的 匹配 策略 进 
配 、 合 并 来 构成 下 一 个 更 小 的 粗 化 超 图 互 ，。 在 瓦 KEI 
两 个 节点 将 会 在 五 ,; 阶段 合并 为 一 个 节点 ,合并 后 的 节点 
为 所 合并 的 节点 权重 之 和 。 
然而 超 图 粗 化 策略 的 选取 对 粗 化 剖 分 的 质量 至 关 重 要 
有 的 贪 焚 匹 配 算法 主要 考虑 超 边 权重 ， 尽 可 能 多 地 对 权 


的 超 边 中 的 节点 进行 匹配 ， 并 没有 考虑 节点 权重 对 匹配 效 曙 


init| ? 


法 对 超 图 模型 进行 分 割 , 达到 最 小 化 计算 节点 间 通 信 量 的 目的 。 


化 阶 
构建 
RH 
进行 
回 原 
地 解 
粗 化 


作 。 
EST 
v| 
fTUL 
配 的 
权重 


5, 现 
较 大 


粗 划 齐 分 结果 的 影响 。 为 得 到 更 好 的 粗 化 效果 ， 本 文 在 此 
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过 考虑 节点 及 超 边 权重 对 粗 化 效果 的 影响 ， 优 化 节点 


策略 。 sa id 


3 所 示 。 


居 支 持 能 力 的 粗 化 策略 (CBSD ) 流程 如 


AH, 


根据 妃 rr 计算 超 边 
DEREI 


e 


依次 选取 超 边 ， 找 
P" 


两 个 未 匹配 项 


y 
到 超 边 中 权重 和 最 小 的 


Z] 


Tid 


按照 


z] 3 基于 数 ] 
首先 ， 本 文 将 采 | 
质 序 依次 对 超 边 中 的 
较 小 但 其 所 属 的 具有 较 大 边 权 的 超 边 进行 优先 匹配 ， 
可 能 多 地 隐藏 边 权 , 另 一 方面 又 
有 利于 计算 初始 粗 化 剖 分 和 提 


EFF 


E 力 的 粗 化 算法 (CBSD) 流 程 图 


JHF 


序 函 数 jw XTA 
节点 进行 匹配 ， 


这 样 便 可 对 节点 


F 务 超 边 进行 降序 


匹配 
图 


权重 


一 方面 尽 
能 避免 合并 后 的 节点 权重 过 大 ， 


高 细 化 算法 的 效率 。 基 于 上 


分 析 ， 排 序 函 


当 节 点 削减 来 7 满足 终止 条 件 9 ， 


数 fri 定义 如 下 : 


1 
fas) me.) OnE) 


通 


该 轮 粗 化 操作 终止 ， 


r 的 值 小 于 10% 时 终止 粗 化 操作 。 


2.2.2 粗 化 分 割 及 细 化 阶 
当 超 图 足够 小 , 即 削 


段 
减 率 小 于 阔 值 时 , 进入 粗 化 分 割 阶段 ， 


面 的 


G) 


[E 


这 一 阶段 的 目 


分 割 来 得 到 
3873 k 份 并 不 
的 本 地 


一 个 原始 


的 是 在 满足 虚拟 机 间 
cuts(H , P) 。 选 取 粗 化 阶段 中 的 最 优 分 割 
次 和 欠 代 操作 将 其 映射 


的 是 ， 通 过 对 上 一 阶段 得 到 的 最 小 可 | 
制 结果 。 然 而 ， 将 粗 化 图 分 


超 图 
能 代表 原始 


沁 化 操作 能 够 很 好 地 解决 这 个 问 
负载 均衡 的 条 件 


的 初始 分 
图 的 高 质量 分 区 


， 但 细 化 阶段 中 
题 。 细 化 阶段 的 主 


重复 


排列 ; 


ChinaXi 
胡 志 刚 ， 等 : 云 环境 下 面向 负载 均衡 的 数据 密集 型 工人 


而 本 文 提 出 的 HEFTPS 调度 算法 则 将 会 以 


任务 进行 调度 。 令 5 为 pi 中 优先 级 最 大 的 


行 的 依赖 关系 ， 该 算法 将 pi 的 优先 级 设 为 5 的 优先 级 ， 
务 进行 调度 ， 从 而 降低 该 


对 已 经 准备 好 的 任 


1 


流 的 数据 约 


E 务 集合 为 
任务 ， 为 满足 人 


E 务 的 等 待 


i 
Rr 


i 
阐 策略 


E 务 执 
UR 
时 间 。 


对 


快 


即将 p, 所 包含 的 任务 中 最 大 的 rank, t) 值 作为 p. 的 优先 级 


rank, , 


rank; = max [rank, (t, ) 


文中 将 会 根 
调度 算法 调度 之 
HEFT-PS 算法 描述 如 下 : 
算法 3 HEFT-PS 调度 算法 
输入 : Partition 
输出 : 任务 执行 结果 
begin 
计算 所 有 任务 
将 p, dE VR EE P] 
while 列表 中 有 未 调度 p, 

从 调度 列表 里 取 第 
for 每 个 计算 节点 v,eQ 
计算 p, T£ v, 上 的 执行 时 间 


end for 


口 ， 


1) 
2) 
3) 
4) 
5) 
6) 
7) 
8) 
9) 
10) 
11) 


个 也 


end while 
end 


伪 代 码 第 2、3 行 计 


优先 级 rank, 对 p, 进行 调度 。 
每 个 p, 都 被 分 配 到 了 合适 的 虚拟 机 上 。 


的 rank, ,及 所 有 Partition 的 rank, 
表 里 按 照 rank, 的 非 递 增 顺序 进行 排序 


EFT( p,q ) 


将 p. WOE EFT(pi,v) 最 小 的 计算 节点 上 


算 每 一 个 分 区 p, ， 即 任务 集合 优先 


的 p,, 计算 其 在 每 一 个 计算 节点 上 的 
最 小 EFT 的 计算 节点 上 。 调 度 结束 后 
rank, 在 其 所 在 的 计算 节点 上 顺序 执行 。 
为 On*p")，P 为 计算 节点 


复杂 度 为 On* p) ,MCP 的 时 间 复 杂 


的 条 件 下 ， 随 着 7 的 增加 ，HEFT-PS 算法 


降低 分 区 间 的 
ZUR. 细 化 阶 有 


LH 


原 


始 超 图 ， 


并 在 每 次 迭代 中 使 用 


化 算法 


来 提高 它 质 量 。 


其 中 较 成 功 的 细 化 方法 主要 是 基于 


Kernighan-Lin(KL) 和 Fiduccia- Mattheyses (FM) 启 发 式 算 法 的 优 


化 与 
2.3 


>, 


调度 算法 


文中 基于 HEFT 算法 提出 了 HEFT-PS 调度 算法 , 以 上 节 分 


割 后 得 到 的 分 
集 型 工作 流 的 


示 。 传 统 算法 将 会 


高 效 调度 


直接 根 扩 


区 py JE ROCHE A EG HR 


度 , 从 而 实现 对 数据 密 


任务 优先 级 rank, (t) 的 计算 如 式 (6) 所 


居 任 务 的 优先 级 对 单个 任务 进行 1 


EE 


ME. o 


3 ”实验 


本 文选 


错误 ! 未 找到 引用 源 。 


HEFT-P 


为 验证 


平台 进行 实验 ， 
PERA 


EFT, 
Eo, KRIY 


墨尔本 大 学 网 格 实验 室 的 CloudSim RH 


按照 非 递增 顺序 放 入 调度 列表 中 ; 第 4-10 行 依次 选取 未 i 


(6) 


经 过 HEFT-PS 


的 优势 将 


调度 算法 的 性 


型 工作 流 


FJ 


DAG 图 分 别 通过 模拟 设置 和 


用 两 种 方式 产生 。 
0 
测试 平台 ， 色 动 化 定制 生成 数据 
据 密集 型 应 用 ce 


将 其 调度 至 
每 个 任务 
该 算法 的 时 间 复 杂 
的 个 数 。 HEFT、CPOP 算法 的 时 
EJ On * logn) ,其 中 ， 
n 为 任务 的 个 数 。D 的 数值 相对 7 而 言 一 般 较 小 ， 


在 P 值 相 
会 越 来 越 


密集 型 应 用 、 
以 及 在 验证 数 # 


型 应 用 满足 数据 密集 型 特征 


错误 ! 未 找到 引用 源 。 


IOzone 个 经 


后 , 存储 所 生成 的 数据 密 
的 数据 密集 型 任 


验证 


nus 


Al 


明 


| 算 仿真 
He. 数 
实际 工作 流 


4 应 用 (data-intensive application, DIA) 


" 


A 


AI 


集 型 


应 用 。 


务 和 文件 系统 的 


201805.00481 v1 


chinaXiv 


录用 稿 


测试 工具 ， 该 工 


主要 用 以 测试 文件 系统 的 读 写 性 能 。 


每 一 个 


iozone 操作 都 是 独立 的 测试 任务 , 具有 原子 性 。 平 台 基于 
中 三 个 核心 原子 操作 (R,W,RW) 自 动 组 合 定 制 生成 了 一 种 的 典 


lozone 


HIREA 


js 


型 应 
最 大 节点 数 ， 最 小 节点 数 ， 
任务 的 个 数 对 IOZones 应 用 进行 定制 。 生 成 的 数据 密集 型 应 用 
以 DAG 图 的 形式 保存 在 本 地 ， 


户 可 输入 IOZones 的 主要 参数 ， 
DAG 图 的 层 数 ， 最 大 宽度 以 及 RW 


] Iozones。 用 


会 产生 两 个 文件 ， 


分 别 保 存 DIA 


各 个 节点 之 间 依 赖 关系 的 DAG 图 信息 文件 iozones dag.txt, 以 


及 保存 每 个 节点 中 的 命令 信息 iozones_command .txt。 


实际 工作 流 采 / 
1。 模拟 设置 任务 数目 分 别 为 {50,100} 和 {25,100} 个 ， 任 务 数目 


hinaXiv 合 


iH 


C i i 
HEN, Pi 云 环境 下 面向 负载 均衡 的 数据 密集 型 工作 流 的 数据 约 简 策 咯 


算法 的 ASL 差异 较 小 。 由 于 此 时 系 


统 可 | 


主要 因素 成 为 可 | 
在 模 


结果 表现 最 佳 。 如 图 


为 150MB-250MB, 


] CyberShake 及 Montage 标准 科学 工作 流 


造成 了 VO 资源 的 耗费 与 调度 时 间 


反映 了 工作 流 应 ) 
成 测试 平台 ) 项 目 实例 库 中 的 benchmark 实例 。 任 务 平 


规模 。 工作 流 实例 选 自 于 (数据 密集 型 应 用 集 
均 通 信 时 


间 与 平均 执行 时 间 的 比值 CCR 表示 任务 类 型 的 集合 , 当 CCR>1 


时 ， 表 示 任 务 集 合 的 通信 比重 大 于 执行 比重 ， 


中 设置 CCR>1。 


为 数据 密集 型 任 
每 种 规模 生成 30 组 不 同 的 实例 。 模 


拟 设 


计算 节点 数 


35373 (4,8,16,32,64) D, 56 23:35] E 7 


{10%,20%,30%,40%, 49%}。 综合 以 上 的 
+2*2)*5*5=2350 个 测试 实例 。 


问题 参数 , 共生 成 (3*30 
实验 采用 HEFT, CPOP 和 MCP 


经 典 调度 算 


HE 
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如 图 4(a) 月 


[ 示 ， 当 任 


务 数目 小 于 计算 节点 数目 时 ， 各 调度 


本 策略 能 够 取得 较 低 的 ASL。 


400 [—— 


E CyberShake 中 ， 
它 的 实际 平均 数据 读 
的 输入 数据 大 小 却 仅 


其 他 算法 ， 


资源 相对 丰富 , 各 调 
度 算 法 都 能 依据 简单 的 启发 式 策略 执行 调度 决策 , 影 
资源 总 量 ， 而 非 算 法 本 身 。 在 实验 中 发 现 ， 

型 痢 分 时 将 负载 均衡 阔 值 参数 设 为 0.2 时 ， 本 文 策 略 调 度 
4(b) 所 示 ， 随 着 计算 节点 数目 的 增加 ， 

HEFT-P 依然 能 够 得 到 较 好 的 调度 结果 。 在 
一 种 叫做 Seismogram-Synthesis 的 任务 ， 

取 量 为 547MB/job aw， 但 其 所 需 
这 意味 着 存在 一 些 输入 数据 被 反复 读 取 ， 
的 延长 。 相 较 于 


向 ASL 的 


350 


300 Hom 


200 


ASL 


32 64 


: 2 m 
计算 节点 个 数 
(a) 50 个 CyberShake 工作 流 的 ASL 
ES MCP 
CPOP 
EX HEFT 
EjHEFRR 


4 8 


iu 
计算 节点 个 数 


32 B4 


(b) 100 个 CyberShake 工作 流 的 ASL 


图 4 不 同 任务 数 
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